Google TPU v6 Trillium
Google 第六代 TPU(Tensor Processing Unit),代号 Trillium,2024-05 发布、2024-12 GA,由 Google + Broadcom 联合设计,是 Google 内部训练 Google Gemini 模型的主力硬件,也对外通过 Google Cloud Platform 出租。
关键规格
| 维度 | 数值 |
|---|---|
| 发布 | 2024-05 公布 / 2024-12 GA |
| 制程 | TSMC 5nm(推测) |
| FP16 / BF16 算力 | ~926 TFLOPS(单芯片) |
| 显存 | 32 GB HBM3 |
| 显存带宽 | ~1.6 TB/s |
| 互联 | ICI(Inter-Chip Interconnect),TPU Pod 拓扑 |
| 整机形态 | TPU v6e Pod(256 颗)/ 大型集群(数千颗) |
市场定位
Trillium 是 Google "用 TPU 训 Gemini,用 GPU 对外卖"双轨策略的核心:
- 主要服务 Google 自有大模型训练(Gemini 1.5 / 2.0 / 2.5)
- 部分容量通过 GCP 对外出租
- 与 NVIDIA H100/H200 比,TPU 在 JAX/TensorFlow 框架下性价比有优势,PyTorch 兼容性差距是主要劣势
客户与部署
- Google DeepMind —— Gemini 模型训练核心算力
- Anthropic —— 历史上使用部分 Google TPU
- GCP 外部客户 —— 通过 Cloud TPU v6e 实例租用
- 学术机构 —— Google TRC(TPU Research Cloud)项目
演进路线
TPU v1(2016, 推理)→ v2 → v3 → v4 → v5e / v5p(2023)→ v6 Trillium(2024)→ Google TPU v7 Ironwood(2025)
关键来源
- 2-01-核心逻辑芯片 —— CSP 自研芯片市场份额
- 3-01-云计算与智算平台 —— Google Cloud 算力策略
关联
↑ up::2-01-核心逻辑芯片 Broadcom HBM ↓ down::3-01-云计算与智算平台 Google Gemini Google Cloud Platform ⚔ competitor::NVIDIA H100 NVIDIA B200 AWS Trainium 2 AWS Inferentia 2 ∈ belongs_to::2-01-核心逻辑芯片